搜索资源列表
javaSearch
- 目录 目录 1 摘要 3 第一章 引言 4 第二章 搜索引擎的结构 5 2.1系统概述 5 2.2搜索引擎的构成 5 2.2.1网络机器人 5 2.2.2索引与搜索 5 2.2.3 Web服务器 6 2.3搜索引擎的主要指标及分析 6 2.4小节 6 第三章 网络机器人 7 3.1什么是网络机器人 7 3.2网络机器人的结构分析 7 3.2.1如何解析HTML 7 3.2.2 Spider程序结构 8 3.2.3如何构造Spid
je-analysis-1.5.3
- java lucene 开源全文检索,中文分词组件之 je-analysis-1.5.3
je-analysis-1.5.3
- 在java环境下开发的分词源代码,本代码可以通过lucene,nutch调用,实现对中文的分词-Java development environment in the sub-etymology code, this code can be used with lucene, nutch call, the aim is to achieve the Chinese word
lucene-3.5.0
- apache lucene压缩包,lucene-3.5.0.zip-apache lucene Tarball, lucene-3.5.0.zip
NetBoverticalsearchengine
- 网博垂直搜索引擎完全开源版 1.前台结合Lucene的搜索引擎功能,使得数据搜索更快; 2.新增加采集功能,采集时图片下载,flash下载功能,默认配置的是南海网分类信息的采集规则; 3.该代码简洁,完全开源,可以与网博多款新闻系统无缝整合; 4.最新新闻系统已增加伪静态与全站生成静态功能。 5.后台地址:htt://xxx/admin/login.aspx,后台用户名:webhww 密码:http://s.webabc.com.cn/-Net Bo vertical
lzzSearch-1.01
- 网页采集系统 === === ===== 安装配置 --- - 1 程序我就不说了 2 配置文件 applicationContext.xml 里面有详细的注释 3 已经包含了多个论坛博客的参数,如CSDN论坛、博客园、新浪博客、百度Hi、ccidnet等的解析参数 需要的类库 --------- 1 Spring 2.5 2 common-logging 1.1 3 paoding-analysis 2.0.4-beta
sse4j
- SSE4J(Spatial Search Engine for Java)是针对地理信息数据源构建的垂直搜索引擎应用接口,是基于Lucene+JTS Topology Suite开源库设计的框架。 规划的SSE4J包含: 1)SSE4J应用开发包 2)SSE4J Webservice应用接口 3)SSE4J工具集 规划的SSE4J包含的功能: 1) POI搜索(名称、地址、类型等关键字搜索;周边搜索) 2)道路搜索、区域搜索 3)地址匹配、
Lucene-code-src3.0-
- Lucene3.0原理与分析java版 第一章 全文检索的原本原理 第二章 Lucene 的总体架构 第三章:Lucene 的索引文件格式 第四章:Lucene 索引过程分析 第五章:Lucene 段合并(merge)过程分析 第七章:Lucene 搜索过程解析 第八章:Lucene 的查询语法,JavaCC 及QueryParser 第十章:Lucene 的分词器Analyzer-The first chapter of the full text searc
mmseg4j-1.8.5
- mmseg 1.8.5的测试分词项目包 和lucene 3.6.0 相配合使用-corresponding test points words mmseg project package and lucene 3.6.0
lzzSearch-0.4
- 1 完全基于人工收录,每个被收录的帖子都是我们认为不错的。 2 任何人都可以加入,别人也可以分享到你加入的内容 3 收录的内容,不是简单的抓取,而是只收录里面最有用的部分,比如主题,内容,作者,发言时间等 4 由于上一个的原因,所以不是任何网站都能加入,后面有目前支持的网站列表。 5 增加新的网站支持,需要写3个正则表达式,进行帖子内容的精确匹配 6 使用Lucene进行存储和查询 7 开源,可以在自己的机器上部署一个,拥有自己的收藏和搜索工具。 8 同
jspxcms-3.0.5-release-src
- 网站源代码程序,非常有用,集成搜索引擎lucene,具有大量模板-Website source code program, very useful, integrated search engine lucene
laud
- 搜索引擎服务器1.支持多项目2.支持多数据库数据持久化3.resful请求4.有demo实例5.底层是apache lucene-laud web seacher
lucene-core-2.4.1.jar je-analysis-1.5.3.jar
- import jeasy.analysis.MMAnalyzer 实现句子中文分词的jar包(import jeasy.analysis.MMAnalyzer Jar package for Chinese word segmentation in sentences)